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摘要 : DNA 拓扑 异 构 酶 与 断 开 DNA. 链 和 改变 其 拓扑 结构 有 关 。 先 前 的 研究 认为 ， 拓 扑 异 构 酶 Type IB 是 
由 Type [| A 通过 基因 的 复制 、 重 组 和 缺失 所 造成 。 然 而 ， 本 研究 结果 则 显示 ，Type LA Type IB 的 进化 关 
ARE, 而 Type IA 5j Type [[B 的 关系 较 远 。 因 此 ，Type TB 可 能 是 由 Type I A 演化 而 米 ， RAL, Type I 
B 是 Type I A 在 古 细菌 中 的 特 化 形式 ; Type IB 可 能 是 由 Type IA 通过 形成 Type I A 后 演化 而 成 的 ， 而 不 是 
由 Type IL A 直接 通过 基因 的 复制 、 重 组 和 缺失 所 造成 。 在 由 Type IA 演 化 成 为 Type I A， 最 后 演化 为 Type I 
B 的 过 程 中 ，DNA 拓扑 异 构 酶 的 催化 机 制 也 发 生 了 变化 : 从 需要 金属 离子 的 协助 ， 演 化 到 了 不 需要 镁 离子 的 存 
在 协助 其 催化 。 
关键 词 : DNA 拓扑 异 构 酶 ，CAP-like 结构 域 ; Toprim 结构 域 ; 分 子 进化 ， 催 化 机 制 
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Abstract: DNA strand scission and topology changes are catalyzed by DNA topoisomerases. Previous studies suggest 
that Type [| B topoisomerase evolved from Type l| A by gene duplication, recombination and absence. However, this 
study shows that the evolutionary relationship between Type | A and [| B is closer than that between Type [I A and IL B. 
Thus, Type IIB is possibly from Type I A, or Type [| B is a special form of | A in archaebacteria; Type [| B is probably 
evolved from |[ A via I A rather than from [[ A directly. During the evolution of II A to [[ B via I A, the catalytic mech- 
anisms of DNA topoisomerases have also been changed; that is, metal ions are necessary in the catalyses for both. | A and 
ILA, but no ion is needed for [[ B. 
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DNA 拓扑 异 构 酶 ( DNA topoisomerase ) 是 生命 引起 双 链 DNA 的 断裂 。 根 据 作 用 端的 不 同 ，Type 
活动 中 一 类 重要 的 酶 ， 它 可 催化 单 链 或 双 链 DNA 工 又 可 分 为 两 类 : [ A 类 DNA 拓扑 异 构 酶 (Type 
断 开 和 结合 的 偶 联 反应 ， 从 而 改变 DNA 的 拓扑 结 La) 作用 于 5 - 端 ; m [ B 类 DNA 拓扑 异 构 酶 
构 ( Wang, 1985, 1996; Champoux，2001 )。 根 据 (Type I B) 作用 于 3'- 端 。Type I A 包括 细菌 
DNA 链 断 裂 反 应 过 程 中 产生 断口 性 质 的 不 同 ， Topoisomerase 工 Topoisomerase lll. tr 28H Re- 
DNA 拓扑 异 构 酶 可 分 为 两 类 : I 类 DNA 拓扑 异 构 verse gyrase、 古 细菌 Topo I. E43 Æ% Topo Ill 
酶 (Type I ) 引起 DNA 糖 -磷酸 骨架 上 的 单 链 — (Gangloff et al, 1999; Dai et al, 2003); Type IB 
DNA 的 断裂 ; mI DNA 拓扑 异 构 酶 (Type D) ”包括 真 核 生物 Topoisomerase I (Topo I ) 38 8E 
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Topoisomerase 工 、 原 核 生 物 Topoisomerase V ( Topo 
V) ( Krogh & Shuman, 2002; Forterre，2006 )。 虽 
9A. Type 了 都 是 作用 于 5' - 端 ， 但 根据 其 基因 结 
构 和 作用 机 制 的 不 同 ， 又 分 为 Type IL A M Type II 
Bo Type 工 A 类 中 的 toprim ( topoisomerase/primase ) 
和 CAP-like ( catabolite-activitor protein-like ) 结构 域 
分 别 分 布 于 A 和 B 两 个 亚 基 上 ， 并 且 反 应 中 需要 
金属 离子 参与 ， 在 断 开 DNA 双 链 后 产生 4 个 碱 基 
的 错位 ， 而 Type I| B 类 中 的 toprim 和 CAP-like Zi 
构 域 都 存在 于 A 亚 基 上 ， 反 应 中 不 需要 金属 离子 
参与 ， 断 口 只 有 两 个 碱 基 错 位 (Buhler et al, 
2001). Type I A 包括 真 核 生 物 Topoisomerase Il 
(Topo II )、 细 菌 DNA gyrase、 极 少数 古 细 菌 gyrase 
以 及 细菌 Topoisomerase IV ( Topo IV ) (Wang， 
1985, 1996; Champoux，2001); 而 Type II B XE 
括 古 细菌 Topo VI (Buhler et al, 2001 ). 

Type TIA、IA 和 [TB 具有 两 个 相似 的 结构 
域 ， 在 断裂 和 结合 DNA 的 过 程 中 起 作用 ， 一 个 是 
CAP-like 结构 域 ， 由 于 其 折合 方式 类 似 于 E. coli 
的 分 解 代谢 物 活化 蛋白 而 得 名 ， 研 究 表明 ，CAP- 
like 结构 域 不 仅 存 在 于 Type 1A, DAMIB, 
也 存在 于 真 核 生物 减 数 分 裂 重 结合 因子 〈Spol1l ) 
中 (Champoux，2001; Nichols et al, 1999); 另 一 
个 是 toprim 结构 域 ， 不 仅 存 在 于 Type LA. IA, 
TB 中 ， 而 且 在 细菌 的 引物 酶 ( Primase ) 和 核酸 酶 
中 也 有 发 现 ( Corbett & Berger，2004 )。 此 外 ,在 
Type 上 A 中 发 现 两 个 CAP-like 结构 域 ， 即 具有 催 
化 功能 的 CAP-like ( d3) 结构 域 和 不 具 催 化 功能 的 
CAP-like (d4) 结构 域 ， 而 CAP-like (d4) 结构 域 
的 二 级 结构 排列 方式 与 Type IA, IL B 的 类 似 
(Liu & Wang，1999 )。 先前 的 研究 表明 , Type I[ B 
是 祖先 细胞 的 Type IL A. 的 一 个 或 者 是 两 个 亚 单位 
在 古 细菌 以 及 真 核 生物 中 通过 复制 、 重 组 和 缺失 所 
造成 ; 上 古 细 菌 失去 了 Type MA, 保留 了 Type II B, 
而 真 核 生物 失去 了 Type IB 中 的 B 亚 单位 ， 保 留 
了 A 亚 单 位 ， 并 且 发 展 成 为 Spoll (Nichols et al, 
1999; Corbett & Berger, 2003a )。 由 于 Type I| B Bj 
结构 和 功能 与 其 他 类 酶 的 不 同 ， 显然 没 有 同 源 性 ， 
鉴于 Type II B 基因 在 toprim 和 CAP-like 这 两 个 
要 结构 域 的 连接 方式 与 Type LA, MA 的 顺序 完全 
不 同 ， 因 此 ， 本 研究 以 Type TIA、IA 和 ITB 中 都 
含有 的 toprim 和 CAP-like 结构 域 为 重点 ， 进 一 步 探 
讨 了 Type 工 和 Type 开 之 间 的 分 子 进 化 关系 。 





















































1 材料 与 方法 


本 文 所 用 的 序列 都 取 自 SWISS-PROT 蛋白质 序 
列 数据 库 ( Bairoch & Apweiler, 2000 )， 结 构 域 的 
定义 来 自 于 SCOP 数据 库 ( Murzin & Brenner, 
1995 )， 所 用 到 的 基因 组 信息 均 来 自 于 GenBank 数 
据 库 (Benson et al, 1997 )。 序 列 用 Clustal W 程序 
( Thompson et al, 1994) 进行 比 对 ， 比 对 结果 利用 
PHYLIP 软件 包 构 建 NJ 树 进 行 系统 演化 分 析 
( Felsenstein, 1996 )。 各 个 结构 域 在 各 种 生物 基因 
中 的 分 布 ， 运 用 PS-BLAST ( 值 <0.005 ) 对 美 
国 国立 生物 技术 信息 中 心 (NCBI) 的 微生物 基因 
组 数据 库 〈 Altschul et al, 1997 ) 进行 搜索 后 确定 。 
运用 COMPARER on-line 程序 ( Sali & Blundell, 
1990) 对 引物 酶 和 三 类 拓扑 异 构 酶 中 toprim 结构 域 
进行 基于 结构 的 序列 比 对 。 


2 结 果 


基因 组 搜索 结果 显示 ，Type 上 A 广泛 分 布 于 细 
菌 、 古 细菌 、 真 核 生 物 以 及 极 少数 病毒 中 ; Type 
ILA 存在 于 细菌 、 古 细菌 和 真 核 生物 中 ; Type MB 
仅 存 在 于 古 细菌 中 。 

细菌 Type IL A 包含 两 个 亚 基 ， 分 别 由 两 个 基 
因 编 码 ， 即 gyrA 和 gyrB (Æ gyrase 中 )， 或 parc 和 
parE (在 Topo IV), Mi toprim 和 CAP-like 结构 域 
分 别 位 于 这 两 个 亚 基 上 。 真 核 生物 和 极 少数 双 链 病 
毒 Type I| A 的 toprim 结构 域 在 前 ，CAP-like 结构 
域 在 后 ， 由 一 个 基因 编码 。 通 常 ，Type [ A 具有 两 
个 CAP-like 结构 域 ， 即 d3 和 d4 结构 域 (图 1), 
然而 ， 进 一 步 的 基因 组 搜索 发 现 ， 许 多 细菌 的 Type 
LA 往往 具有 多 个 序列 长 度 不 同 的 拷贝 ,但 其 中 至 
少 有 一 个 拷贝 同时 具有 d3 和 d4 结构 域 。 

Type B 包含 两 个 亚 基 ， 由 两 个 基因 分 别 编 
码 ， 其 CAP-like 结构 域 和 toprim 结构 域 在 同一 个 亚 
基 上 ，CAP-like 结构 域 在 前 ，toprim 结构 域 在 后 ， 
这 与 Type LA. ILA 的 顺序 完全 不 同 (图 1)。 

在 Type LA. ILA IILB 中 都 具有 一 个 结构 相 
似 的 同 源 toprim 结构 域 ， 并 且 Type I A 的 d4 结构 
域 与 Type IA. IL B 的 CAP-like 结构 域 的 二 级 结构 
类 似 ， 其 顺序 均 为 Qi1B10203B2B3; 而 Type [ A d3 2 
构 域 的 二 级 结构 顺序 则 为 B1a2a3B2B3a1 0 

CAP-like 结构 域 序列 间 最 大 相似 性 的 分 析 显 示 
( 表 1)，Type I A 的 d4 结构 域 与 Type II B 序列 间 
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的 相似 性 最 高 ， 其 次 为 同属 于 Type ITA 的 d3 与 d4 
的 相似 性 ， 而 Type IA -+ Type I A B5 d4 I IE B ÉY 
相似 性 基本 相同 ，TypeIA 与 1A 的 d3 的 相似 性 
最 低 。 同 样 toprim 结构 域 序列 间 最 大 相似 性 分 析 
也 表明 ( 表 2)，Type [A 与 Type II B 的 相似 性 最 
Ho Type IA、ITA 和 TB 的 CAP-like 结构 域 的 系 
统 演化 分 析 表 明 ，Type IA 与 属于 Type LA ÉY d3 
关系 较 近 ， 而 Type TB 与 属于 Type LA 的 d4 关系 
较 近 (图 2)。Type LA. ILA FI [T B 的 toprim 结构 
域 的 系统 演化 分 析 则 显示 ，Type I A 与 Type IA 
fil [| B 的 关系 基本 相同 (图 3 )。 

对 toprim 结构 域 进行 基于 结构 的 序列 比 对 显 
IW, 除了 4 个 保守 位 点 外 ,它们 的 序列 差异 很 大 
(图 4), 但 这 4 个 保守 位 点 均 是 与 DNA 结合 相关 的 
活性 位 点 ( Gangloff et al, 1999; Dai et al, 2003; 
Berger et al, 1998 )。 

利用 CAP-like 结构 域 进 行 基因 组 搜索 ， 结 果 
明 ， 并 不 是 所 有 物种 中 的 Type I A 都 同时 具有 d3 






































表 1 Type IA, IAÑ T B 的 CAP-like 结构 域 
序列 间 的 最 大 相似 性 ( % ) 
Tab. 1 The maximum similarity ( % ) between 
CAP-like domain sequences in Type IA, 





IA and I B 
| Ad3 | Ad4 IL A IL B 
| Ad3 100 20.0 13.5 13.7 
| Ad4 20.0 100 17.3 20.7 
IL A 13.5 17.3 100 17.0 
IL B 13.7 20.7 17.0 100 


和 d4 结构 域 ， 有 的 只 具有 d3 结构 域 ， 而 有 的 则 只 
具有 d4 结构 域 。 例 如 ,在 Haemophilus influenzae 
R2846 中 ,其 Type I A( NR 数据 库 , 检索 号 为 
ZP00155446 ) 没 有 发 现 d4 结构 域 ,而 在 Haemophilus 
somnus 129PT 的 Type I A( NR 数据 库 , 检 索 号 为 ZP 
- 00123147 ) 中 则 缺少 d3 结构 域 。 


3 W it 


Type I A 和 Type ITA 在 细菌 、 古 细菌 、 真 核 
生物 中 广泛 分 布 ， 而 Type IB 则 仅 分 布 于 古 细菌 
中 ,因此 ，Type IAF I A 可 能 是 比 Type IL B £ 
为 古老 的 拓扑 异 构 酶 。 

虽然 先前 对 Type TÁJ B WEI EAPN SNA 
和 结合 DNA 功能 无 关 的 拓扑 异 构 酶 结构 域 研 究 显 
ZN. Type TB 是 由 Type II A 通过 基因 的 复制 、 
组 和 缺失 所 造成 的 ( Nichols et al, 1999; Corbett & 
Berger，2003b )。 然 而 ， 本 研究 通过 对 Type TA 和 
Type 开 中 共同 存在 的 .具有 结合 或 断裂 DNA 功 能 






































表 2 Type [ A. IAÑ [I B 的 toprim 结构 域 
序列 间 的 最 大 相似 性 ( % ) 

Tab. 2 The maximum similarity ( % ) between 

toprim domain sequences in Type IA, 





IA and I B 
| A 工 A I| B 
[A 100 19.7 21.5 
Il A 19.7 100 21.0 
IL B 21.5 21.0 100 


d3 CAP-like d4 CAP-like | Type I 


CAP-like | alpha-beta | allalpha | Type TTA Bacteria 


CAP-like | alpha*beta | allalpha | Type IIA Eukaryotes 
CAI Type lip 


图 1 DNA 拓扑 蜡 构 酶 的 结构 域 排列 


Fig. 1 





The arrangement of DNA topoisomerase domains 


Toprim: toprim 结构 域 ( toprim domain ); barrel: 桶 状 结构 域 (barrel domain ); d3 CAP-like: 
Type | A 类 第 3 个 结构 域 (the third domain of Type I A); d4 CAP-like: Type I A 类 第 4 个 结 
构 域 ( the fourth domain of Type [ A); ATPase: Type I| A 类 ATP 酶 结构 域 (the ATPase domain 
of Type ILA); 2nd: I| A 类 第 2 个 结构 域 (the second domain of Type I| A); CAP-like: CAP- 
like 结构 域 (CAP-like domain ); alpha + beta: Type IA 类 au+B 结 构 域 (the alpha + beta domain 
of Type I A); all alpha: Type I| A 类 全 a 结构 域 ( all alpha domain of Type [| A); middle: Type 
II B 类 中 间 结 构 域 (the middle domain of Type II B )。 
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图 2 CAP-like 结构 域 的 进化 树 ( 1000 bootstrap ) 


Fig. 2 The phylogenic tree of CAP- 


IA: IA 类 (Type IA); IB: IB% (Type IIB); 
Type LA); LAd4: 工 A 类 第 4 个 结构 域 (the fourth 





like domains ( 1 000 bootstrap ) 
[ Ad3: [A 类 第 3 个 结构 域 (the third domain of 








的 CAP-like 和 toprim 结构 域 的 比较 分 析 表 明 ，Type 
IA 与 TA 中 toprim 和 CAP-like 结构 域 排列 的 先后 
顺序 是 一 致 的 ， 而 与 Type B 的 明显 不 同 (图 0): 
因而 ， 从 toprim 和 CAP-like 结构 域 排列 顺序 来 看 ， 
Type I A fll Type IL A 5 Type TB 都 应 该 相距 较 远 。 
然而 ， 序列 和 系统 演化 分 析 则 表明 ，Type IL B 可 能 
是 由 Type I A 演化 而 来 ,或 者 说 ，Type IB 是 [A 
在 古 细菌 中 的 特 化 形式 (E2, 3): KE, Type II 
B 可 能 是 由 Type I A 通过 形成 Type I A 后 演化 而 
成 的 ， 而 不 是 由 Type IL A 直接 通过 基因 的 复制 、 
组 和 缺失 所 造成 的 。 此 外 ， 在 催化 机 制 上 ，Type 
[A fil Type IA 较 之 Type TB 更 为 相似 ，Type I 
A FI Type ITA 在 行使 催化 功能 时 都 需要 金属 离子 
( 如 镁 离子 ) WEE, m Type IL B 的 在 行使 催化 功 
能 时 ， 却 不 需要 金属 离子 的 存在 ,通常 ， 同 源 和 蛋白 
质 催 化 机 制 的 相似 性 ， 是 其 进化 关系 的 反应 : 因 
此 ,催化 机 制 的 相似 性 也 提示 ，Type IL B 可 能 是 由 
Type I| A 通过 形成 Type I A 后 演化 而 成 的 。 

通常 ，Type D A 具有 两 个 CAP-like 结构 域 ， 即 
d3 和 d4 结构 域 ， 然 而 基因 组 搜索 发 现 ， 并 不 是 所 


















































omain of Type I A). 


有 物种 中 的 Type D A 都 同时 具有 d3 和 d4 结构 域 ， 
有 的 只 具有 qa 结构 域 ; 有 的 则 只 具有 dà 结构 域 。 
研究 表明 ，d3 结构 域 具 有 催化 功能 ， 而 da 结构 域 
不 具 众 化 功能 ( Berger et al，1998 )。 然 而 ，d4 Zi 
构 域 是 否 具有 其 他 的 功能 呢 ? 进一步 的 基因 组 搜索 
显示 ， 许 多 细菌 往往 具有 多 个 序列 长 度 不 同 的 Type 
LAN, 但 其 中 至 少 有 一 个 拷贝 同时 具有 d3 和 
d4 结构 域 。 因 此 ， 在 具有 多 拷贝 Type | A 的 物种 
H, Ub d3 或 d4 结构 域 的 Type 上 A 应 该 都 不 具有 
功能 ， 真 正 行使 功能 的 可 能 是 同时 具有 d3 和 d4 结 
构 域 的 那个 Type D A。 虽然 ，d4 结构 域 不 具 催 化 
功能 (Berger et al, 1998), 但 它 的 存在 可 能 对 于 
Type I A 完成 催化 功能 是 必需 的 ， 它 可 能 对 催化 功 
能 的 完成 起 到 间接 或 者 辅助 的 作用 。 

综 上 所 述 ， Type IL B 很 可 能 是 由 Type 工 A 演 
化 而 来 ， 并 且 在 由 Type IA WERI Type LA 最 
后 演化 为 Type IL B 的 过 程 中 ，DNA 拓扑 异 构 酶 的 
催化 机 制 也 发 生 了 变化 : 从 需要 金属 离子 的 协助 ， 
演化 到 了 不 需要 镁 离子 的 存在 协助 其 催化 ， 同 时 ， 
JE DNA 断口 的 错位 碱 基数 目 也 发 生 了 变化 。 
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TP2BCHICK — TP2B MOUSE 
TP2A CHICK 
TOP2 YEAST 
TOP2 CAEEL TOP2 CANAL 


GYRB VIBPA 


TOP3 HAEIN 
GYRB BUCBP 


TOP3 PASMU 


GYRB SALTY 





TOP3 ECOLI 
4 
TOP1 ECOLI 
TP6A METJA 
847 
TOP1 SALTY = TP6A SULSH 
TOP1PASMU 
029238 0 
051934 0 TP6A AERPE 
Q8R979 0 
100 TP6A SULTO 


图 3 toprim 结构 域 的 进化 树 ( 1 000 bootstrap ) 
Fig. 3 The phylogenic tree of toprim domains ( 1 000 bootstrap ) 
LA: LAŽ (Type LA; HA: A 类 (Type IA); IIB: IB 类 (Type IIB) 


1i7da (14) ( 1) MRLF I AEKPSLARAIADVLP ----- GQVVTWCIGHLVTKQLNV I KRFLHE 
ibjtOCHIA) ( 443 ) CTLVLTEGDSALSLAVAGLAVVGRDYYGCYPLRGKM- -AE | QA 1KK IMG- 
1d3ya (11B) ( 192 ) FILAIETSGMFARLNAE------- NCILVSLKGVPARATRRF I KRLHEE 


bbbb  aaaaaaaaa bbbb aaaaaaaaaaa a 
1i7da(1AÀ) ( 95) AS-E I VHAGDPDREGQLLVDEVLDYLQ 
1bjtO (11A) ( 519 ) --GHLMIMTDQD-HIKGL 1 INFLESS 
1d3ya (11B) { 240 ) HDLPVLVFTDGDP YGYLN!YRTLKV 
bbbb aaaaaaaaaaaaa 


图 4 不 同类 型 的 拓扑 异 构 酶 toprim 结构 域 基于 结构 的 序列 比 对 


Fig. 4 The structure-based sequence alignment of toprim domains 





in different Topoisomerases 

li7d: 大 肠 杆 菌 Topo Ill ( I A 25) ( Escherichia coli Topo Ill (Type I A2); 1d3y: 古 细 菌 Topo VI 
C ILB 25 ) C Methanococcus jannaschii Topo VI ( Type ILB); 1bjt: 酵母 菌 Topo Il ( IL A 2$) ( Sac- 
charomyces cerevisiae Topo I| (Type II A); 阴影 (shadow ): 保守 位 点 (the conservative amino acid 
residues ); a: a 螺旋 (a-helix); b: BÆ ( g-sheet )。 
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